Processing math: 100%

যথার্থতা যাচাই (দশম অধ্যায়)

একাদশ- দ্বাদশ শ্রেণি - পরিসংখ্যান পরিসংখ্যান ২য় পত্র | - | NCTB BOOK
926
926

যথার্থতা (Accuracy):

পরিসংখ্যান অধ্যায়ে যথার্থতা একটি গুরুত্বপূর্ণ ধারণা, যা একটি পরিমাপ বা তথ্যের সঠিকতা ও নির্ভুলতাকে নির্দেশ করে। এটি আমাদের জানায় যে, একটি তথ্য বা পরিমাপ প্রকৃত অবস্থার সাথে কতটা সঙ্গতিপূর্ণ।

পরিসংখ্যানের ক্ষেত্রে যথার্থতা যাচাই করা কেন গুরুত্বপূর্ণ? কারণ আমাদের তথ্য-উপাত্তের সঠিকতা নির্ভর করে সিদ্ধান্ত গ্রহণের কার্যকারিতা ও কার্যকারণ বিশ্লেষণের ওপর। যথার্থতার অভাব ভুল সিদ্ধান্তের দিকে পরিচালিত করতে পারে এবং তা গবেষণা ও ব্যবস্থাপনায় মারাত্মক প্রভাব ফেলে।

যথার্থতার মাপকাঠি পরিসংখ্যানের বিভিন্ন ক্ষেত্রে ব্যবহার করা হয়, যেমন:

  • গবেষণা ও বিশ্লেষণ: সঠিক ডেটা থেকে কার্যকরী সিদ্ধান্ত গ্রহণ।
  • পরিমাপ ও মানদণ্ড: যন্ত্র ও পদ্ধতির নির্ভুলতা যাচাই।
  • প্রভাব বিশ্লেষণ: ডেটার উপর ভিত্তি করে নীতিমালা নির্ধারণ।

এই অধ্যায়ে আমরা যথার্থতা কী, এর প্রভাব, যাচাই পদ্ধতি, এবং পরিসংখ্যান গবেষণায় এর গুরুত্ব সম্পর্কে বিশদভাবে আলোচনা করব। এটি আপনাকে তথ্য বিশ্লেষণ ও পরিমাপের ক্ষেত্রে বাস্তব ও সঠিক সিদ্ধান্ত গ্রহণে সহায়তা করবে।

যথার্থতা যাচাই সম্পর্কিত কতিপয় সংজ্ঞা (১০.১)

507
507

যথার্থতা যাচাই সম্পর্কিত কতিপয় সংজ্ঞা:

  1. যথার্থতা (Accuracy):
    যথার্থতা হলো একটি পরিমাপ বা ডেটা প্রকৃত মানের সাথে কতটা সঠিক এবং সঙ্গতিপূর্ণ তা নির্দেশ করার মাপকাঠি। এটি ডেটার সঠিকতা এবং নির্ভুলতার মানদণ্ড।
  2. নির্ভুলতা (Precision):
    নির্ভুলতা বোঝায় যে একটি পরিমাপ বারবার করার পর প্রতিটি পরিমাপের মান কতটা নিকটবর্তী বা সঙ্গতিপূর্ণ। যদিও এটি যথার্থতার অংশ, এটি সরাসরি প্রকৃত মানের সাথে সম্পর্কিত নয়।
  3. ত্রুটি (Error):
    ত্রুটি হলো প্রকৃত মান ও পরিমাপের মানের মধ্যে পার্থক্য। এটি যথার্থতার ঘাটতির নির্দেশক।
  4. পরিমাপের পক্ষপাতিত্ব (Measurement Bias):
    এটি হলো পদ্ধতিগত ত্রুটি যা পরিমাপের যথার্থতাকে প্রভাবিত করে এবং সঠিক ফলাফল থেকে বিচ্যুতি ঘটায়।
  5. যথার্থতা যাচাই (Validation of Accuracy):
    ডেটা বা পরিমাপের যথার্থতা যাচাই করতে ব্যবহৃত পদ্ধতি বা প্রক্রিয়া। এতে বিভিন্ন পরীক্ষামূলক পদ্ধতি, পুনরাবৃত্তি এবং সংশোধনী অন্তর্ভুক্ত।
  6. প্রকৃত মান (True Value):
    প্রকৃত মান হলো একটি পরিমাপের সেই মান, যা তাত্ত্বিক বা পরীক্ষামূলকভাবে সঠিক বলে ধরা হয়।
  7. উপাদানগত ত্রুটি (Systematic Error):
    এটি হলো সেই ত্রুটি, যা একটি নির্দিষ্ট পদ্ধতি বা সরঞ্জামের কারণে সব পরিমাপে প্রভাব ফেলে।
  8. ইচ্ছাকৃত ত্রুটি (Random Error):
    এটি হলো দৈব ত্রুটি, যা পরিমাপের পরিবেশ বা মানদণ্ডের তারতম্যের কারণে ঘটে এবং এটি পূর্বানুমান করা যায় না।

এগুলো যথার্থতা যাচাইয়ের ক্ষেত্রে গুরুত্বপূর্ণ এবং পরিসংখ্যানের বিভিন্ন প্রয়োগে ব্যবহার করা হয়।

যথার্থতা যাচাই এর জন্য ব্যবহৃত বিভিন্ন স্ট্যাটিস্টিক (১০.২)

282
282

যথার্থতা যাচাই এর জন্য ব্যবহৃত বিভিন্ন স্ট্যাটিস্টিক:

যথার্থতা যাচাই পরিসংখ্যানের গুরুত্বপূর্ণ একটি দিক। এর মাধ্যমে ডেটা বা পরিমাপের সঠিকতা ও নির্ভুলতা নির্ধারণ করা হয়। নিচে যথার্থতা যাচাইয়ের জন্য ব্যবহৃত বিভিন্ন গুরুত্বপূর্ণ স্ট্যাটিস্টিক তুলে ধরা হলো:


১. গড় ত্রুটি (Mean Error):

  • সংজ্ঞা: গড় ত্রুটি হলো পরিমাপকৃত মান এবং প্রকৃত মানের মধ্যে গড় পার্থক্য।
  • সূত্র:
    Mean Error=ni=1(XiT)n
    যেখানে,
    Xi = পরিমাপকৃত মান
    T = প্রকৃত মান
    n = মোট পরিমাপের সংখ্যা

২. গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

  • সংজ্ঞা: এটি একটি বহুল ব্যবহৃত পরিসংখ্যান, যা ত্রুটির স্কোয়ারের গড়ের বর্গমূল নির্দেশ করে। এটি ডেটার বিচ্যুতি পরিমাপ করে।
  • সূত্র:
    RMSE=ni=1(XiT)2n

৩. গড় আপেক্ষিক ত্রুটি (Mean Absolute Error - MAE):

  • সংজ্ঞা: পরিমাপকৃত মান এবং প্রকৃত মানের মধ্যে গড় আপেক্ষিক পার্থক্য। এটি ত্রুটির একটি সরল মাপকাঠি।
  • সূত্র:
    MAE=ni=1|XiT|n

৪. শতকরা ত্রুটি (Percentage Error):

  • সংজ্ঞা: পরিমাপকৃত মানের শতকরা বিচ্যুতি।
  • সূত্র:
    Percentage Error=|XT|T×100

৫. সহগ (Coefficient of Variation - CV):

  • সংজ্ঞা: এটি গড় মানের তুলনায় ডেটার বিচ্যুতি নির্ধারণ করে।
  • সূত্র:
    CV=σμ×100
    যেখানে,
    σ = ডেটার মানের স্ট্যান্ডার্ড ডেভিয়েশন
    μ = গড়

৬. নির্ভুলতার সহগ (Accuracy Ratio):

  • সংজ্ঞা: এটি পরিমাপের সঠিকতা বুঝাতে ব্যবহৃত হয় এবং প্রকৃত মানের সাথে ডেটার সামঞ্জস্যতা নির্দেশ করে।
  • সূত্র:
    Accuracy Ratio=Predicted ValueActual Value

৭. কপেলার সহগ (Correlation Coefficient):

  • সংজ্ঞা: এটি দুই ডেটাসেটের মধ্যে সম্পর্ক নির্ধারণ করতে ব্যবহৃত হয়। যথার্থতার জন্য উচ্চতর সহগ ভালো বলে ধরা হয়।
  • সূত্র:
    r=ni=1(XiˉX)(YiˉY)ni=1(XiˉX)2ni=1(YiˉY)2

৮. স্ট্যান্ডার্ড ডেভিয়েশন (Standard Deviation):

  • সংজ্ঞা: এটি ডেটাসেটের গড় থেকে বিচ্যুতির গড় নির্দেশ করে। কম স্ট্যান্ডার্ড ডেভিয়েশন উচ্চ যথার্থতা নির্দেশ করে।
  • সূত্র:
    σ=ni=1(XiˉX)2n

৯. R-Squared (Coefficient of Determination):

  • সংজ্ঞা: এটি একটি পরিসংখ্যান, যা পূর্বানুমান এবং প্রকৃত ডেটার মধ্যে সামঞ্জস্যতা নির্দেশ করে।
  • রেঞ্জ: ০ থেকে ১ (১ হলে এটি পূর্ণ সঙ্গতিপূর্ণ)।

উপসংহার:
উপরোক্ত পরিসংখ্যানগুলো ব্যবহার করে যথার্থতা যাচাই করা যায়। নির্ভুলতা এবং সঠিকতা নিশ্চিত করতে এই মেট্রিক্সগুলো গবেষণা ও বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা পালন করে।

গড়ের ক্ষেত্রে যথার্থতা যাচাই (১০.৩)

284
284

গড়ের ক্ষেত্রে যথার্থতা যাচাই:

গড় (Mean) পরিসংখ্যানের একটি গুরুত্বপূর্ণ মাপনী, যা ডেটার কেন্দ্রীয় প্রবণতা বোঝায়। তবে, গড়ের যথার্থতা যাচাই করতে হলে ডেটার সঠিকতা, নির্ভুলতা এবং প্রকৃত মানের সাথে সামঞ্জস্যতা যাচাই করতে হয়। নিচে গড়ের যথার্থতা যাচাইয়ের বিভিন্ন দিক তুলে ধরা হলো:


১. গড়ের ত্রুটি (Error in Mean):

গড়ের ক্ষেত্রে যথার্থতা যাচাই করতে ডেটার প্রকৃত গড়ের সাথে পরিমাপকৃত গড়ের পার্থক্য নির্ণয় করা হয়।

ত্রুটির সূত্র:
\[
\text{Mean Error} = |\bar{X}{observed} - \bar{X}{true}|
\]
যেখানে,
\(\bar{X}{observed}\) = প্রাপ্ত গড়
\(\bar{X}{true}\) = প্রকৃত গড়


২. গড় আপেক্ষিক ত্রুটি (Mean Absolute Error - MAE):

গড়ের ক্ষেত্রে সমস্ত মানের গড় আপেক্ষিক ত্রুটি পরিমাপ করে গড়ের যথার্থতা যাচাই করা হয়।

সূত্র:
MAE=ni=1|XiˉX|n
যেখানে,
Xi = ডেটার মান
ˉX = প্রাপ্ত গড়
n = ডেটার মোট সংখ্যা


৩. গড়ের গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

গড়ের যথার্থতা যাচাইয়ের আরেকটি জনপ্রিয় পদ্ধতি হলো RMSE। এটি ত্রুটির স্কোয়ারের গড়ের বর্গমূল নির্দেশ করে।

সূত্র:
RMSE=ni=1(ˉXXi)2n


৪. গড়ের স্ট্যান্ডার্ড ডেভিয়েশন (Standard Deviation):

গড়ের মান থেকে প্রতিটি ডেটার বিচ্যুতি পরিমাপ করে ডেটার সঠিকতা যাচাই করা হয়। যদি স্ট্যান্ডার্ড ডেভিয়েশন কম হয়, তাহলে গড়টি বেশি সঠিক।

সূত্র:
σ=ni=1(XiˉX)2n


৫. সহগ বিচ্যুতি (Coefficient of Variation - CV):

গড়ের বিচ্যুতি যাচাই করতে CV ব্যবহার করা হয়, যা গড়ের তুলনায় ডেটার বৈচিত্র্য নির্দেশ করে।

সূত্র:
CV=σˉX×100
যেখানে,
σ = স্ট্যান্ডার্ড ডেভিয়েশন
ˉX = গড়


৬. শতকরা ত্রুটি (Percentage Error in Mean):

গড়ের ক্ষেত্রে শতকরা ত্রুটি ব্যবহার করে গড়ের যথার্থতা সহজে যাচাই করা যায়।

সূত্র:
\[
\text{Percentage Error} = \frac{|\bar{X} - \bar{X}{true}|}{\bar{X}{true}} \times 100%
\]


৭. নমুনার আকারের প্রভাব (Effect of Sample Size):

যদি নমুনার আকার বৃদ্ধি করা হয়, তবে গড়ের মান প্রকৃত মানের কাছাকাছি আসে। সুতরাং, যথার্থতা যাচাইয়ের ক্ষেত্রে বড় নমুনা ব্যবহার করাও গুরুত্বপূর্ণ।


উদাহরণ:

ধরা যাক, একটি ডেটাসেট থেকে গড় নির্ণয় করা হয়েছে ˉX=50, এবং প্রকৃত গড় ˉXtrue=48
তাহলে:

  • Mean Error: |5048|=2
  • Percentage Error: 248×100=4.17

এটি নির্দেশ করে যে গড়টি প্রকৃত মানের সাথে প্রায় ৪.১৭% বিচ্যুত।


উপসংহার:
গড়ের যথার্থতা যাচাই করতে বিভিন্ন পরিসংখ্যানিক পদ্ধতি ব্যবহৃত হয়, যা ডেটার মান ও ত্রুটির প্রকৃতি বুঝতে সাহায্য করে। যথার্থ গড় নির্ণয়ের জন্য ত্রুটি নির্ণয়, বড় নমুনা ব্যবহার, এবং ডেটার বৈচিত্র্য নিয়ন্ত্রণ করা অপরিহার্য।

অনুপাতের ক্ষেত্রে যথার্থতা যাচাই (১০.৪)

268
268

অনুপাতের ক্ষেত্রে যথার্থতা যাচাই:

পরিসংখ্যান এবং গণিতের ক্ষেত্রে অনুপাত (Ratio) হলো দুটি সংখ্যার তুলনার একটি রূপ। অনুপাতের যথার্থতা যাচাই করা গুরুত্বপূর্ণ, কারণ এটি সঠিক সিদ্ধান্ত গ্রহণ এবং বিশ্লেষণের জন্য অপরিহার্য। যথার্থতা যাচাইয়ে আমরা বিভিন্ন মাপকাঠি এবং সূত্র ব্যবহার করি যা অনুপাতের সঠিকতা নিশ্চিত করতে সহায়তা করে।


১. গড় ত্রুটি (Mean Error):

অনুপাতের ক্ষেত্রে গড় ত্রুটি নির্ণয় করা হয় প্রকৃত অনুপাত এবং প্রাপ্ত অনুপাতের পার্থক্য দিয়ে।

সূত্র:
Mean Error=ni=1|RiRtrue|n
যেখানে,
Ri = প্রাপ্ত অনুপাত
Rtrue = প্রকৃত অনুপাত
n = ডেটার সংখ্যা


২. আপেক্ষিক ত্রুটি (Relative Error):

অনুপাতের ক্ষেত্রে আপেক্ষিক ত্রুটি নির্ণয় করে দেখা হয় প্রকৃত অনুপাতের তুলনায় প্রাপ্ত অনুপাত কতটা সঠিক।

সূত্র:
Relative Error=|RiRtrue|Rtrue


৩. গড় আপেক্ষিক ত্রুটি (Mean Absolute Percentage Error - MAPE):

এটি অনুপাতের গড় আপেক্ষিক ত্রুটি নির্ধারণে ব্যবহৃত হয়।

সূত্র:
MAPE=1nni=1(|RiRtrue|Rtrue×100)


৪. গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

এটি অনুপাতের যথার্থতা যাচাইয়ে ব্যবহৃত একটি জনপ্রিয় পদ্ধতি। এটি ত্রুটির গড় বর্গমূল নির্দেশ করে।

সূত্র:
RMSE=ni=1(RiRtrue)2n


৫. সহগ বিচ্যুতি (Coefficient of Variation - CV):

অনুপাতের বিচ্যুতি নির্ধারণে এটি ব্যবহৃত হয়। যদি CV কম হয়, তাহলে অনুপাতটি যথার্থ।

সূত্র:
CV=σRˉR×100
যেখানে,
σR = অনুপাতের স্ট্যান্ডার্ড ডেভিয়েশন
ˉR = প্রাপ্ত অনুপাতের গড়


৬. শতকরা ত্রুটি (Percentage Error):

অনুপাতের যথার্থতা যাচাই করতে সরাসরি শতকরা ত্রুটি ব্যবহৃত হয়।

সূত্র:
Percentage Error=|RobservedRtrue|Rtrue×100


৭. সংবেদনশীলতা বিশ্লেষণ (Sensitivity Analysis):

অনুপাতের মান পরিবর্তনের জন্য ব্যবহৃত ভেরিয়েবলগুলোর প্রভাব পরীক্ষা করা হয়। এটি অনুপাতের যথার্থতা নির্ধারণে সাহায্য করে।


৮. সঠিকতা নির্ধারণ (Validation of Accuracy):

ডেটা বা পরিমাপের অনুপাত প্রকৃত মানের সাথে কতটা সঠিক তা যাচাই করতে কপেলার সহগ (Correlation Coefficient) ব্যবহার করা যায়।

সূত্র:
\[
r = \frac{\sum_{i=1}^{n} (R_i - \bar{R})(R_{true} - \bar{R}{true})}{\sqrt{\sum{i=1}^{n} (R_i - \bar{R})^2 \cdot \sum_{i=1}^{n} (R_{true} - \bar{R}_{true})^2}}
\]


উদাহরণ:

ধরা যাক, একটি পরিমাপ থেকে প্রাপ্ত অনুপাত Ri=4:1, এবং প্রকৃত অনুপাত Rtrue=5:1
তাহলে:

  • Mean Error: |45|=1
  • Percentage Error: 15×100=20
  • RMSE: (45)21=1

উপসংহার:
অনুপাতের যথার্থতা যাচাই করার মাধ্যমে সঠিক এবং নির্ভুল তথ্য উপস্থাপন সম্ভব। উপরোক্ত পদ্ধতিগুলো ব্যবহার করে ডেটার সঠিকতা নিশ্চিত করা যায়, যা গবেষণা এবং বিশ্লেষণের মান উন্নত করে।

ভেদাঙ্কের ক্ষেত্রে যথার্থতা যাচাই (১০.৫)

393
393

ভেদাঙ্কের (Variance) ক্ষেত্রে যথার্থতা যাচাই:

ভেদাঙ্ক (Variance) একটি গুরুত্বপূর্ণ পরিসংখ্যানিক মাপকাঠি, যা ডেটার গড় মান থেকে মানগুলোর বিচ্যুতি পরিমাপ করে। ভেদাঙ্কের যথার্থতা যাচাই করা অত্যন্ত গুরুত্বপূর্ণ, কারণ এটি ডেটার ছড়িয়ে থাকার পরিমাণ বা বৈচিত্র্য নির্ধারণে ব্যবহৃত হয়। যথার্থতা যাচাইয়ের মাধ্যমে ভেদাঙ্ক সঠিকভাবে গণনা করা হয়েছে কিনা তা নিশ্চিত করা হয়।


ভেদাঙ্কের যথার্থতা যাচাইয়ের পদ্ধতি:

১. গড় ত্রুটি (Mean Error):

ভেদাঙ্কের গড় ত্রুটি নির্ণয় করে দেখা হয় প্রকৃত ভেদাঙ্ক (σ2true) এবং প্রাপ্ত ভেদাঙ্ক (σ2observed) এর মধ্যে পার্থক্য।

সূত্র:
Mean Error=|σ2observedσ2true|


২. আপেক্ষিক ত্রুটি (Relative Error):

আপেক্ষিক ত্রুটি ভেদাঙ্কের ক্ষেত্রে একটি সাধারণ যাচাই পদ্ধতি। এটি প্রকৃত ভেদাঙ্কের তুলনায় প্রাপ্ত ভেদাঙ্ক কতটা সঠিক তা বোঝায়।

সূত্র:
Relative Error=|σ2observedσ2true|σ2true


৩. গড় আপেক্ষিক ত্রুটি (Mean Absolute Percentage Error - MAPE):

ভেদাঙ্কের গড় আপেক্ষিক ত্রুটি নির্ণয় করে দেখা হয় ভেদাঙ্কের মানের শতকরা বিচ্যুতি।

সূত্র:
MAPE=1nni=1(|σ2iσ2true|σ2true×100)


৪. গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

গড় বর্গমূল ত্রুটি ভেদাঙ্কের যথার্থতা যাচাইয়ের জন্য একটি বহুল ব্যবহৃত পদ্ধতি। এটি প্রাপ্ত এবং প্রকৃত ভেদাঙ্কের স্কোয়ারের গড়ের বর্গমূল নির্দেশ করে।

সূত্র:
RMSE=ni=1(σ2iσ2true)2n


৫. শতকরা ত্রুটি (Percentage Error):

ভেদাঙ্কের শতকরা ত্রুটি নির্ণয়ের মাধ্যমে প্রাপ্ত ভেদাঙ্ক এবং প্রকৃত ভেদাঙ্কের পার্থক্য শতকরা হিসাবে পরিমাপ করা হয়।

সূত্র:
Percentage Error=|σ2observedσ2true|σ2true×100


৬. স্ট্যান্ডার্ড ডেভিয়েশন এবং ভেদাঙ্কের তুলনা:

যেহেতু স্ট্যান্ডার্ড ডেভিয়েশন (σ) হলো ভেদাঙ্কের বর্গমূল, তাই স্ট্যান্ডার্ড ডেভিয়েশন এবং ভেদাঙ্কের সঙ্গতিপূর্ণতা যাচাই করাও গুরুত্বপূর্ণ। যদি স্ট্যান্ডার্ড ডেভিয়েশন এবং ভেদাঙ্কের সম্পর্ক সঠিক হয়, তবে তা যথার্থতার ইঙ্গিত দেয়।

সম্পর্ক:
σ2=Variance (ভেদাঙ্ক)


উদাহরণ:

ধরা যাক, একটি ডেটাসেট থেকে প্রাপ্ত ভেদাঙ্ক σ2observed=25, এবং প্রকৃত ভেদাঙ্ক σ2true=20
তাহলে:

  • Mean Error: |2520|=5
  • Percentage Error: 520×100=25
  • RMSE: (2520)21=5

ভেদাঙ্ক যাচাইয়ের সংবেদনশীলতা:

ভেদাঙ্ক সঠিকভাবে নির্ণয়ের জন্য বড় নমুনা আকার ব্যবহার করা জরুরি। ছোট নমুনার ক্ষেত্রে ভেদাঙ্ক যথার্থতা প্রভাবিত হতে পারে।


উপসংহার:

ভেদাঙ্কের যথার্থতা যাচাই করার জন্য বিভিন্ন পদ্ধতি ব্যবহার করা হয়, যেমন Mean Error, RMSE, এবং Percentage Error। এগুলো ব্যবহার করে ডেটার বৈচিত্র্য নির্ভুলভাবে নির্ধারণ করা যায়। যথার্থ ভেদাঙ্ক নির্ণয় গবেষণা এবং বিশ্লেষণের মান উন্নত করে।

টপ রেটেড অ্যাপ

স্যাট অ্যাকাডেমী অ্যাপ

আমাদের অল-ইন-ওয়ান মোবাইল অ্যাপের মাধ্যমে সীমাহীন শেখার সুযোগ উপভোগ করুন।

ভিডিও
লাইভ ক্লাস
এক্সাম
ডাউনলোড করুন
Promotion
;